| Название базовой системы (платформы): | Искусственный интеллект (ИИ, Artificial intelligence, AI) |
| Разработчики: | Smart Engines (Смарт Энджинс) |
| Дата премьеры системы: | 2025/06/20 |
| Дата последнего релиза: | 2025/10/01 |
| Технологии: | Big Data, Data Mining, ИБ - Система обнаружения мошенничества (фрод) |
Содержание |
Основные статьи:
- Большие данные (Big Data)
- Data mining Интеллектуальный анализ данных
- Fraud Detection System (фрод, система обнаружения мошенничества)
2025
Выход на рынок Ирана и Пакистана
Российская ИИ-система «Шерлок» для распознавания и проверки документов, созданная Smart Engines, получила возможность работать с удостоверениями личности на урду и персидском языках. Это стало возможным благодаря специализированному датасету MIDV-UP, созданному учеными компании и включающему более 9000 изображений документов Пакистана и Ирана. Данный набор данных закрывает давний пробел в разнообразных и неперсонифицированных обучающих материалах и открывает «Шерлоку» выход на рынки с совокупным населением свыше 330 миллионов человек. Об этом Smart Engines сообщили 1 октября 2025 года.
На октябрь 2025 года языковые технологии искусственного интеллекта поддерживают лишь небольшую часть из более чем 7000 языков мира. Алфавиты на основе латиницы уже давно освоены системами ИИ, в то время как обучение систем распознавания языкам с другими системами письменности происходит значительно медленнее. Особенно остро проблема обстоит с урду и персидским (фарси) – государственными языками Пакистана и Ирана. Оба языка используют модифицированный арабский алфавит и отличаются сложными лигатурами.
Ранее существующие датасеты документов оставляли практически без внимания удостоверения личности на урду и персидском. Это препятствовало разработке технологий распознавания, способных работать с документами Пакистана и Ирана. Представленный Smart Engines датасет MIDV-UP изменил эту ситуацию, обеспечив разработчиков качественными данными для обучения ИИ. В состав MIDV-UP вошли 1000 уникальных образцов удостоверений нескольких типов документов – ID-карт, водительских удостоверений и свидетельств о рождении Ирана, а также ID-карт Пакистана. В общей сложности в датасете содержится 9000 полностью аннотированных изображений, полученных безопасным методом синтеза – способом создания обучающих данных без использования документов реальных людей.TAdviser Security 100: Крупнейшие ИБ-компании в России + 100 претендентов
MIDV-UP охватывает большой спектр сценариев предъявления документов – от сканов до фотографий и видеоклипов с естественными помехами: тенями, бликами и искаженной перспективой. Специалисты Smart Engines использовали MIDV-UP для обучения нейросетевого ансамбля «Шерлок», предназначенного для распознавания и комплексной проверки физических и цифровых документов.
«Шерлок» способен работать одновременно в видимом, ультрафиолетовом и инфракрасном диапазонах, анализировать голограммы и другие защитные элементы, осуществляя в общей сложности более 600 проверок. Это дает возможность детектировать подделки любой сложности и качества, начиная с паспортов с измененными и переклееными фотографиями и заканчивая муляжами и дипфейками. Решение было разработано при финансовой поддержке Фонда содействия инновациям.
| | Отсутствие надежных ИИ-решений долгое время оставляло неавтоматизированным огромный рынок цифровых услуг, требующих ввод данных из документов на урду и фарси. Благодаря нашему датасету эти документы больше не является преградой для «Шерлока». На октябрь 2025 года устойчивый спрос на технологии распознавания наблюдается не только в самих Пакистане и Иране, но и в России и других государствах – чему способствуют значительные миграционные и образовательные потоки. Теперь стало возможным масштабировать «Шерлока» как внутри страны, так и на международных рынках, – отметил один из авторов MIDV-UP, генеральный директор Smart Engines, д.т.н. Владимир Арлазаров. | |
Анонс мультимодальной модели ИИ "Шерлок 2o"
Специалисты российской компании Smart Engines разработали мультимодальную модель искусственного интеллекта для борьбы с поддельными документами. "Шерлок 2o" проверяет документы всех стран на подлинность по 600 параметрам и детектирует сложные подделки в любых каналах обслуживания. Принятые решения модель объясняет понятным для пользователя языком, сообщили представители Smart Engines 20 июня 2025 года.
Как они ответили, мультимодальные модели представляют собой самый прогрессивный класс нейросетевых архитектур, способных одновременно обрабатывать разные типы входных данных – текст, изображения, аудио, видео. На быстрорастущем рынке мультимодального ИИ (оценен в $1,6 млрд) Россия до недавнего времени была представлена преимущественно разработками на базе больших языковых моделей.
Исследователи Smart Engines совершили прорыв, представив технологию в области мультимодальной форензики. "Шерлок 2o" способен одновременно работать с изображениями документов из оптического, ультрафиолетового и инфракрасного спектров, видео-последовательностями с документом, текстовыми полями, данными с бесконтактной RFID-микросхемы, штрих-кодами, метаданными и сигнатурами. Даже если часть информации отсутствует, "Шерлок 2o" сохраняет высокую точность детекции подделки.
При этом модель воспринимает документ не как набор разрозненных данных, а как единую взаимосвязанную систему. "Шерлок 2o" анализирует не только все страницы и элементы по отдельности, но и логические связи между ними. Модель выявляет даже скрытые несоответствия – например, нарушения в нумерации страниц, различия в микрошрифтах или неочевидные расхождения между данными RFID-чипа и визуальной информацией.
Комплексный подход позволяет выявлять сложные подделки, где могут быть заменены отдельные страницы или переклеена фотография, нарушена последовательность элементов защиты или присутствуют микроскопические расхождения в оформлении. ИИ также детектирует подделки, созданные с применением дипфейк-технологий.
Соответствие закону обеспечивается как на этапе обучения ИИ, так и во время работы системы у клиента. "Шерлок 2o" работает в контуре у заказчика без использования GPU, при этом документы и данные ни в каком не передаются на обработку в сторонние сервисы, облачным верификаторам, на краудсорсинговые платформы.
| | «Сегодня во всем мире наблюдается тренд на разработку мультимодальных продуктов. Однако в отличие от уже известных систем, базирующихся на больших языковых моделях, технология Smart Engines использует возможности мультимодального ИИ для решения важнейшей прикладной задачи – защиты от мошеннических атак. Система может использоваться в любых сценариях, требующих предоставления документов – в банках, МФО, страховых компаниях, госсекторе», – отметил генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров. | |
Смотрите также
Подрядчики-лидеры по количеству проектов
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
Данные не найдены
Распределение систем по количеству проектов, не включая партнерские решения
Подрядчики-лидеры по количеству проектов
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
Данные не найдены

